Meta Platforms因涉嫌未经授权使用爱思唯尔、圣智等多家出版商的书籍和期刊文章训练AI模型Llama,在纽约曼哈顿联邦法院面临集体诉讼。出版商指控Meta盗用数百万部作品,侵犯版权。
Meta推迟Llama4发布至5月,因技术挑战影响性能优化。该模型是Meta AI战略关键,延期或影响其与OpenAI等竞争。
Meta 的 Llama 4 项目被曝出数据“美化”丑闻,前首席科学家杨立昆承认团队为优化基准测试结果调整了数据。这一行为引发争议,暴露了 Meta 在 AI 技术发展中的管理偏差。此前,Llama 系列因开源策略备受认可,但此次事件可能影响其声誉。
Meta前AI负责人杨立昆在专访中爆料,公司开发Llama 4时存在“造假”行为,并批评现任AI官Alexandr Wang年轻缺乏经验。因不满公司战略变动,他选择离职,转向“世界模型”研究。
Alibaba
-
输入tokens/百万
输出tokens/百万
上下文长度
Bytedance
Baidu
Tencent
$2
Anthropic
$105
$525
200
Chatglm
128
amd
Llama-3.1-8B-onnx-ryzenai-npu是由AMD基于Meta的Llama-3.1-8B模型开发的优化版本,专门针对AMD Ryzen AI NPU进行优化部署。该模型通过Quark量化、OGA模型构建器和NPU专用后处理技术,在保持高质量文本生成能力的同时,显著提升了在AMD硬件上的推理效率。
Mungert
基于Meta Llama-3.3-70B-Instruct的大语言模型,经过多阶段训练优化,在推理、聊天等任务上表现出色,支持多种语言,适用于多种AI应用场景。采用神经架构搜索技术优化,能够在单个H100-80GB GPU上高效运行。
FastFlowLM
这是基于Meta AI的LLaMA 3.1基础模型的衍生模型,专门针对AMD Ryzen™ AI NPU上的FastFlowLM进行了优化,仅适用于XDNA2架构。模型保留了Meta发布的核心架构和权重,可能针对特定应用进行了微调、量化或适配。
这是Meta AI发布的LLaMA 3.2 1B Instruct模型的优化变体,专门针对AMD Ryzen™ AI NPU(XDNA2架构)上的FastFlowLM进行优化。模型保留了原始架构和权重,通过量化、底层调优等技术提升在NPU上的运行效率。
RedHatAI
Llama-4-Scout是Meta推出的Llama 4系列模型之一,采用混合专家(MoE)架构,是原生多模态AI模型,支持文本和图像输入,在多语言文本理解和视觉任务方面表现出色。该模型具有17B参数,16个专家,专为商业和研究用途设计。
fahadh4ilyas
Llama 4系列是Meta推出的原生多模态AI模型,采用混合专家架构,支持文本和图像交互,在多种语言和视觉任务中表现卓越。
Llama 4系列是Meta推出的原生多模态AI模型,支持文本和图像交互,采用混合专家架构,在文本和图像理解方面表现卓越。
hirundo-io
Llama 4 Scout是Meta推出的原生多模态AI模型,支持多语言文本和图像理解,采用混合专家架构,在文本和图像理解方面具有行业领先性能。
bnb-community
Llama 4系列是Meta开发的多模态AI模型,支持文本与图像交互,采用混合专家架构(MoE),在文本和图像理解领域具有领先性能。
unsloth
Llama 4 Scout是Meta推出的170亿参数多模态AI模型,采用混合专家架构,支持12种语言和图像理解。
chutesai
Llama 4 Maverick是Meta推出的原生多模态AI模型,采用混合专家架构,支持文本和图像输入,输出多语言文本和代码。
Undi95
Llama 4 Maverick 是 Meta 发布的多模态 AI 模型,支持文本与图像理解,采用混合专家架构(MoE),在多语言文本和代码生成任务中表现优异。
Llama 4 Scout是Meta推出的17B参数/16专家混合的多模态AI模型,支持12种语言和图像理解,具有行业领先性能。
meta-llama
Llama 4 Maverick是Meta开发的多模态AI模型,采用混合专家架构,支持文本和图像理解,具有170亿激活参数和4000亿总参数。
Llama 4系列是Meta开发的多模态AI模型,支持文本和图像理解,采用混合专家架构。
Llama 4 Scout是Meta开发的多模态AI模型,采用混合专家架构,支持12种语言的文本和图像交互,具有17B激活参数和109B总参数。
Llama 4 Maverick是Meta推出的170亿参数多模态AI模型,采用混合专家架构(MoE),支持多语言文本和图像理解,具备128个专家模块。
Llama 4系列是Meta开发的多模态AI模型,支持文本与图像交互,采用混合专家架构(MoE),在文本和图像理解方面具有行业领先性能。
yueliu1999
GuardReasoner 1B是基于meta-llama/Llama-3.2-1B通过R-SFT和HS-DPO微调的版本,专注于分析人类与AI交互的分类任务。
kosbu
Llama-3.3-70B-Instruct的AWQ 4位量化版本,由Meta AI开发,支持多种语言,适用于文本生成任务。